AI不僅能辨識車牌、人臉,還能進行語音辨識、指紋辨識,還能閱讀文章理解其語意幫我們摘要,它之所以能像人類一樣彷彿擁有五官以及思考能力的「大腦」究竟是如何運作、又用到了何種技術呢?讓我們一起來看看吧。
一、人工神經網絡(ANN):模仿人腦神經元相互連接的多層架構
我們的大腦是由數十億個神經元組成並透過神經突觸互相連結,ANN中的「神經元」也組成不同層級,並通過數學方式模擬信息的傳遞與處理。
原理:
例如:
在圖片識別中,第一層神經元可能處理的是圖片的像素,後面的層會逐步處理更複雜的特徵,如邊緣、形狀,一層層處理後後才會辨識出一隻貓或狗。
對應我們人類大腦處理圖像時:
當我們觀看一個物體時,大腦首先辨識簡單的線條、區塊和顏色、然後逐步進行細節的觀察,最後才會成功辨別是什麼物體
例如:
電腦視覺-
自動駕駛:識別道路標誌和其他道路使用者
內容審核:從影像和影片封存中移除不安全或不當的內容
影像標籤:可識別品牌標誌、服裝、安全裝備和其他影像詳細資訊
語音識別-將對話即時轉化為文件、為影片和會議錄音提供準確的字幕
自然語言處理-虛擬客服人員、對長篇文件進行商業智慧分析、主題的文件摘要和文章產生
<正則化技術 (Regularization):處理過擬合>
什麼是「過擬合」:在訓練數據上表現得非常好,但在未見過的測試數據上表現差,表示模型過度適應了訓練數據中的噪聲或特異性,而不是學習到一般化的規則或模式。就像一個學生對於課本上的題目很熟練,但對於變化性高的題目卻束手無策。
如何解決-Dropout:
在訓練過程中,隨機地「丟棄」一定比例的神經元,防止神經網絡過於依賴某些特定的神經元,促進更好的特徵學習。
二、卷積神經網絡(Convolutional Neural Networks, CNNs)
接下來要介紹的也是神經網絡底下最重要的類型之一、更是日常中最常見的AI應用:圖片辨識
總結來說,AI之所以能像人類一樣處理各種複雜的任務,無論是語音辨識、圖片分類,還是文本理解,都是靠著他們萬能的「大腦」-神經網絡架構。